特斯拉 Optimus 机器人进展:已经生产数百台、还拧不好螺丝
困难在于,马斯克想造人,而不是机器。
文丨贺乾明 李梓楠
编辑丨贺乾明 黄俊杰
“就算我明天被外星人绑架,特斯拉也会解决自动驾驶问题。但我不知道特斯拉怎么在 Optimus 上赢。” 今年 4 月的财报会上,马斯克给出他该拿 500 亿美元薪酬的一个理由。
一位接触过特斯拉团队的人告诉我们,在马斯克说这番话前不久,他就要求人形机器人团队在今年内拿出有意义的突破——让机器人能上产线完成部分工作,如果达不到就进一步裁员,“团队承受的压力越来越大”。
我们得知,Optimus 人形机器人目前已经生产数百台,但还不到可以上产线工作的状态,目前只能用来采集数据、测试不同的设计方案。
这个 2021 年开始推进的人形机器人项目与特斯拉开发其他产品的逻辑截然相反。造车,特斯拉从高利润的电动跑车 Roadster 起步,逐步提升生产效率,造出便宜的 Model 3。自动驾驶也是从低到高,边卖边提升。
而在人形机器人上,马斯克要一步到位,量产就得是终极形态:成本低到 2 万美元以内——低于一个美国蓝领的年收入;但足够智能,能替代一部分工人的工作。
过去 3 年,马斯克公开场合中谈论 Optimus 的次数迅速追上自动驾驶、Robotaxi,将其视为撑起特斯拉估值的希望,“如果我们拥有具备感知能力的人形机器人,能根据要求执行任务,生产力会大幅提高,经济增长就不存在限制。”
中国的股市已经炒作了几轮特斯拉机器人供应链概念股,但马斯克的宏伟故事并没有怎么提振特斯拉的股价。从 2022 年的高点以来,特斯拉的市值已经跌掉近 40%。
特斯拉机器人团队面前的挑战是,一步到位造出像人一般行动的机器人基本不可能。目前他们只能采取一些工程上的妥协,可能针对特定的工作场景,比如拧螺丝,专门训练模型,让人形机器人先发挥一部分作用。至于妥协的结果马斯克能不能接受,还不得而知。
最大的困难:造人,而不是造人形机械装置
根据《马斯克传》,2021 年初,马斯克在特斯拉高管会上播放了波士顿动力人形机器人 Atlas 的视频,画面中人形机器人可以像人一样,灵活完成高难度动作。他告诉参会的高管,“不管你喜不喜欢,人形机器人都会出现。我们应该入局。”
他的目标很明确:必须是一款人形,并且体态和人一样的机器人,而不是波士顿动力公司或其他公司造的四条腿或者带轮子的机械装置。而且机器人得像人一样以视觉观察学习,学会用手完成工作,而不是像波士顿动力或者传统的机械臂公司那样,让工程师预先输入每一行工作指令。
波士顿动力 2020 年底发布 Atlas 机器人视频。来源:波士顿动力。
此前的机器人都针对专门场景设计,导致不够通用,产能有限。根据国际机器人联合会数据,2023 年,全球工业机器人的总销量只有 59 万台——大约是劳力士手表产量的一半。这 59 万台还是至少数十种互不通用的专门形态,大部分年产几百台,完全没有规模效应。
现在所有人形机器人公司都在讲特斯拉机器人的故事:我们的工作场所和工具都是为人而设计。如果人形机器人成真,不需要定制开发,就能以一套硬件完成多种任务,大规模生产同一种型号就有了可能。马斯克谈论人形机器人项目时,经常把规模挂住嘴边,要生产百万台、千万台,甚至十亿台,“量产对于人形机器人来说同样重要,这样才能做到不那么贵。”
区别在于,没有几家人形机器人公司在坚持做人形,它们通常选择折中路线,用各种夹具替代人手或者用轮子替代双腿,先解决一部分问题、产生部分商业价值,再一步步向人形迭代。
但马斯克不妥协。在每周召开的人形机器人讨论会上,他拒绝了大量不像人的设计方案,比如在机器人手臂上装不同的工具,执行不同任务,他认为只用手就足够了。
特斯拉的工程师还觉得机器人的小拇指没什么用,但因为拿掉小拇指 “太惊悚”、太不像人,保留了下来,替代方案是延长小拇指长度,让它能发挥更多作用。马斯克还非常具体地要求,机器人的手指要有女性手指的锥度。他设定机器人身高为 5 英尺 8 英寸高(接近 1 米 73),比美国成年男性平均身高略矮;要求机器人看上去像雌雄同体的精灵,这样 “你就不会觉得它可能要伤害你”。
一位接触过特斯拉团队的投资人说,马斯克对人形的坚持,是为了换掉制约汽车制造的最后一个环节——工人。那时特斯拉已经彻底摆脱产能地狱,上一年卖出 50 万台车,持续攀升的股价推动马斯克成为世界首富。但特斯拉位于加州的汽车工厂每周生产 8550 辆车,逼近产能极限。特斯拉意识到工人的效率已经到达极限,想要更快,只能造比人更强的工具。
汽车制造是自动化程度最高的工业生产工序之一。1960 年代诞生的机械臂,首要场景就是用到汽车工厂中搬运、焊接零部件。特斯拉的汽车工厂中,只有最后的总装环节还需要大量工人参与,用他们的腿在工站中小范围移动,用手组装零部件,或拿着电钻拧螺丝等。想要替代他们,最根本的方法是造出来类似的人。
如果一个机器人能通过机器学习的方式 “理解” 如何工作,像人一样行走、抬手完成特斯拉汽车工厂里的工作,那它应该也能用在其他工作中,产生规模效应。这是一个自然的逻辑推导,只是里面的每一个前提都困难重重,三年下来,特斯拉的团队甚至还没有明确的实现路径。
模糊的探索:如何用机械部件模拟人
特斯拉之前,全球的科学家已为制造一台能用的人形机器人研究了近 50 年。他们面临的任务从始至终都很容易理解,用金属、塑料、硅等材料模拟人的骨骼和血肉,造出一个能像人一样思考、运动的机器。
行业中最出名的人形机器人是波士顿动力制造的 Atlas,能后空翻、在不平整的草地上快速奔跑、在室内灵活跳舞。但波士顿动力在一开始就放弃制造人最独特的两个器官——手和大脑。Atlas 能完成高难度动作,但仅限于提前设定好的动作,双臂的末端是哆啦 A 梦那样的圆疙瘩。
特斯拉开发人形机器人时,最先做的就是人手。人手有 27 个自由度、行动灵活,遍布高敏感的触觉神经,力控能力强大。
早期的方案中,特斯拉给机器手装了 6 个驱动电机,让 Optimus 能握住大部分物体,但远称不上灵活。五根手指中,只有大拇指装了 2 个电机,能够向内弯曲和左右摇摆,剩余 4 根手指只装了能控制弯曲的单个电机摇摆。手部的每个驱动器上都有连着电机的金属线,电机收放金属线时手指相应弯曲伸展。
第二代 Optimus 的手目前只有 11 个自由度。今年 5 月,马斯克声称今年内会将 Optimus 手部自由度提升到 22 个,向人手靠近。现在特斯拉已经有了新一代机械手的方案。
但人手是血肉长在一起的,而不是像机器手那样由不同的零件焊接或者铆接而成。人手在运动时,手腕不会碰撞前方的手掌,动力也不会在人手内部损耗,但这些问题可能在机器手上发生。机器手结构的整体性,关系到手部动作的稳定性和连贯性。特斯拉拿掉了 Optimus 手部的诸多连杆装置,改用电缆制成的绳驱来模仿人手肌肉组织,希望尽量减少机器手运动时产生的动力损耗和迟滞。
人通过肢体变形和神经末梢收到的挤压感知压力,Optimus 则是通过执行器的电流大小测量压力,执行器为 Optimus 提供握住物体的动力,电流大小对应输出的力量大小。人手有数以万计的触觉传感器,Optimus 的手只有 6 个压力传感器,而且无法感受温度。
腿部关节上,特斯拉采用了部分线性执行器,与传统的旋转执行器相比,线性执行器可以纵向布局,最大限度利用腿部内部空间,布置更大更长的电机,提供更大的推动力,第二代 Optimus 的腿部执行器强度足以拉起一架半吨的钢琴。但这样做的坏处是,机器人腿部的平衡更难控制,控制算法的开发难度成倍上升。
在让 Optimus 走路之前,特斯拉还测量了人腿每个关节在行走时的传动机制和每个关节的扭矩,让 Optimus 的动作尽可能像人。从结构上看,人的膝盖是一个高效的四连杆装置,四根骨头加上骨头的膝关节就能胜任走路、跳、下蹲等动作,并精确控制重心让人保持平衡不摔倒。Optimus 目前只能做到缓慢行走,还无法顺利完成下蹲等动作。
数百根骨头和数十个关节连接而成人体有超过 200 个自由度,特斯拉简化到 Optimus 驱干的 28 个自由度。这些自由度由三种不同尺寸的旋转执行器和三种线性执行器实现。旋转执行器分布在需要大角度旋转的肩膀和髋部,线性执行器分布在膝、肘等摆动角度小的部位。
每个执行器都配备丝杠、减速器、电机、传感器和编码器等部件。电机为执行器提供动力,丝杠将部件旋转的力转化为拉伸的力,控制关节收缩和伸展;减速器的作用类似人类骨骼和关节的连接处,能通过杠杆作用放大力量。
提升身体自由度只是用 Optimus 模拟人的第一步。特斯拉还在持续给 Optimus 减重,这能让它相同的功率下完成更多任务。第二代的 Optimus 重量为 56.6 公斤,轻于成年人类。
要做好人形机器人,灵活、耐用、稳定且成本可控的硬件部件和材料只是基础。比如人能接住移动的物体,是因为人脑对重力、加速度等物理规律有认知,因而能预判轨迹,身体又有运动能力,才能完成这个看似简单的动作。
2022 年,特斯拉把汽车上的 FSD(完全自动驾驶)中的机器视觉神经网络移植到 Optimus 上。像教汽车开车那样,让 Optimus 认识现实世界并作出适当的反应,让它从人类的动作中学习并进步。
“自动驾驶是要求汽车在一个 2D 世界里避免碰撞任何物体,但机器人的任务是在 3D 世界里主动碰撞、接触无穷多的事物。” 一位接触过特斯拉团队的投资人说,整个自动驾驶需要面临的技术复杂度还远不如机器人的一只手。
“更大的问题是机器人领域没有 Scaling Laws。” 一位机器人领域投资人说,这是整个智能机器人行业面临的难题,一方面是他们找不到足够多的数据训练机器人模型,另一方面是没有合适的模型架构能消化海量数据。
特斯拉从去年开始招聘人类来当 Optimus 的老师,明确要求身高在 170cm-175cm 之间,与机器人相仿。这些人要带上传感器遍布全身的动作捕捉装置,向机器人演示,人如何运用自己的关节进行活动。一些分析人士猜测,特斯拉未来可能会从海量的视频中抽取人类运动的关键数据,喂给 Optimus 学习,这或许能加快它的学习速度。
按照目前的进度,人形机器人要达到马斯克的最低要求,去特斯拉的汽车工厂中替代一部分工人,还需要漫长的学习和训练。一位特斯拉分析师说,到今年年中,Optimus 在长度超过 500 米的行走测试中通过率只有不到 60%。
它的对手是时薪 22 美元的美国得州小时工,这些工人基本能在 50 秒内完成拾取零件、找对位置完成组装、复核质量等一系列复杂任务。这些人不会走 500 米路就摔倒等人扶,能与其他人完成复杂的沟通、协作,而他们还远远不是全球效率最高、工资最低的工人。
马斯克目前只能说出两项 Optimus 强于人类的地方,它比人类更认真,不开小差;它充满电可以连续工作 16 个小时。
超前的准备:概念阶段就开始考虑量产
“(人形机器人)量产极度困难,是被低估的。”2021 年 8 月的 AI Day 召开时,特斯拉的人形机器人项目还是一个概念,马斯克就预示了即将面临的困难。
设计人形机器人时,特斯拉的团队就在寻找各种办法降低量产的成本和难度。据《马斯克传》,一个典型的例子是如何让机器人手控制施加的压力和感受压力。
工程师们提出了多种方案,比如用指关节中执行器的电流测量压力,在指尖上放置类似手机触摸屏上用到的电容器,或者是嵌入气压传感器或芯片,以及放一个微型摄像头。
机器人行业惯常的做法是在人手的关节处安装压力传感器,这样成本更高且更难造。
看到这些方案,特斯拉首席设计师冯·霍尔兹豪森(Von Holzhausen)只提出了一个问题:成本上有什么区别?最后确定的方案是用关节中的电流,因为不会增加零部件——成本可控,容易生产。
特斯拉造车积累的经验和资源,也迁移到了人形机器人项目中。人形机器人中的电机、电池、软件系统等,早期版本都是从电动车上类似的零部件改造而来,后续也会用特斯拉建立多年的软件基础设施优化。
就像分析电机如何驱动电动车在城市中穿行的那样,他们用仿真系统,模拟人形机器人的 28 个关节各自执行多种动作的性能,找出其中的共性,简化成 6 种单位成本和重量较低的方案。
现阶段的 Optimus 有很多显而易见的问题。接近特斯拉的人士称,软件团队还在想办法用代码取代 Optimus 脚踝上的两个六维力传感器,它们笨重又昂贵,而且只给机器人的稳定性提供了部分冗余。
对特斯拉来说,量产人形机器人最大的挑战是让它有用,足够好用。目前特斯拉还未建成机器人流水线,只能手动组装,单台机器人的造价约等于 10 万美元,但它现在能创造的价值微乎其微。
等开发完足够有用的机器人,特斯拉还要从头开始建设一条低价的供应链。
人形机器人中用到的各种零部件,整个行业中虽然有生产经验,但通常用在高端制造场景中,价格居高不下。比如滚珠丝杠一般用在造价高昂的重型机械或航天设备中。特斯拉做了超前准备,机器人设计还没有定型,团队就开始着手搭建低成本的供应链。
从 2022 年中开始,特斯拉就开始让中国的零部件供应商送零部件测试。其中比较有代表的是特斯拉电动车供应商拓普和三花智控,组装执行器。它们是特斯拉长期供应商,供应车上的铸铝结构件。具体到零部件层面,还有鸣志电器为特斯拉送样机器人手用到的空心杯电机、绿地谐波送样了关节执行器中用到的谐波减速器等。
这些零部件供应商最终能否进入特斯拉机器人产业链,还存在诸多不确定。成本是中国供应商的优势。一位机器人领域分析师说,同一个零部件,中国公司的价格至少比海外知名公司便宜 30%,甚至有些会便宜 80%。但双方的性能还有不小差距。我们了解到,今年中开始的 C 轮第一批送样中,基本没有中国零部件供应商通过特斯拉的要求。
一位接触过特斯拉团队的投资人说,特斯拉内部的目标是在中国之外建立一条人形机器人供应链。这意味着,中国公司想为特斯拉机器人供货,需要先海外投资建工厂。
特斯拉在美国的奥斯汀工厂组装了一批用来测试的人形机器人,截至今年 6 月只有两台在工厂中搬运电池。用成本超过 10 万美元的人形机器人搬运锂电池并无任何价值。电池工厂一般用成本不到 1 万美元,带托盘的无人移动小车装电池,一次能搬上千只。
马斯克再一次启动了他习以为常的循环:用不切实际的时间表,推着团队成员超越极限,在一次次延期中逼近目标。不过有时候,预期与现实之间的鸿沟会大到一两代人也填不满,比如爱迪生一百年前力推的电动车。
题图:视觉中国
1957 年,人造物体第一次进入宇宙,绕着地球飞了三个星期。人类抬头就能在夜幕里看到一颗小小的闪光划过天空,与神话里的星宿并行。
这样的壮举跨越种族与意识形态,在全球各地激起了喜悦之情。但并不是我们可能猜想的那种为人类壮举所感动的胜利喜悦。根据政治哲学家汉娜·阿伦特(Hannah Arendt)当年的观察,人们的情绪更接近于一种等待多时的宽慰——科学终于追上了预期,“人类终于在摆脱地球这个囚笼的道路上迈出了第一步”。
人们总是根据技术探索,快速调整着自己对世界的预期。当科幻作家的一桩畅想变成现实,往往是技术终于追上了人们的预期,或者用阿伦特的话说,“科技实现并肯定了人们的梦想既不疯狂也不虚无。”
今天这样的时候,多一点梦想是更好的。
这也是《晚点 LatePost》启动 TECH TUESDAY 这个栏目的预期。我们希望在《晚点》日常关注的商业世界外,定期介绍新的科学研究与技术进展。
这些可能关于一项前沿研究的进展、可能是对一个技术应用的观察,也可能是对一些杰出技术、乃至一个时代的致敬。
这个栏目将从科学与技术的角度出发,记录这个世界的多样变化。在这个旅途中,希望读者能和我们一起,对这个世界增加一分理解。
· FIN ·